테크노트 카이스트, 인공지능 챗봇 이미지 데이터 훈련 비용 최소화 기술 개발
KAIST 이재길 교수팀, 내달 '신경정보처리시스템학회 2023'서 발표 국내 연구진이 인공지능 챗봇 이미지 데이터 훈련 비용을 최소화하는 기술을 개발했다. KAIST(총장 이광형)는 전산학부 이재길 교수 연구팀이 심층신경망 훈련 비용을 최소화할 수 있도록 훈련 데이터의 양을 줄이는 새로운 데이터 선택 기술을 개발했다고 2일 밝혔다. 일반적으로 대용량의 심층 학습용 훈련 데이터는 레이블 오류(예를 들어 강아지 사진이 `고양이'라고 잘못 표기되어 있음)를 포함한다. 최신 인공지능(AI) 방법론인 재(再)레이블링(Re-labeling) 학습법은 훈련 도중 레이블 오류를 스스로 수정하면서 높은 심층신경망 성능을 달성하는데, 레이블 오류를 수정하기 위한 추가적인 과정들로 훈련에 필요한 시간이 더욱 증가한다는 단점이 있다. 이 교수팀이 개발한 기술은 레이블 오류를 스스로 수정하는 최신 재레이블링 학습법을 위해 핵심 집합 선별을 수행해 심층 학습 훈련 비용을 최소화할 수 있도록 해준다. 레이블 오류가 포함된 현실적인 훈련 데이터를 지원하므로 실용성이 매우 높다고 연구팀은 설명했다. 이 교수팀은 특정 데이터의 레이블 오류 수정 정확도가 해당 데이터 이웃 데이터의 신뢰도와